Сайт Информационных Технологий

МЕТОДЫ СРАВНЕНИЯ СТРУКТУРНЫХ ОПИСАНИЙ ОБЪЕКТОВ

Н.А.Меркулова

Институт математики СО РАН, Новосибирск, Россия

Abstract — This work is devoted to problem of description and comparison of structural objects. Such objects description can be determined as sequence of stages so that set of characters calculated at each stage is influenced by characters at previous steps. In this work is suggested method for describing of complicated objects. This work also contain describing of two methods for calculating distances between structural objects. Theorem about relation between those two methods is adduced in conclusive part of the work.

1. Введение

Существует достаточно широкий класс задач, в которых измерение характеристик объектов проводится в несколько этапов. При этом на каждом этапе набор характеристик для различных объектов может существенно различаться, и это различие зависит от значений характеристик, измеренных на предыдущих этапах. Иными словами, признаковое пространство может иметь довольно сложную структуру связей, а ряд характеристик может состоять из признаков более простой природы.

В большинстве методов распознавания образов внутренние структурные связи пространства признаков либо игнорируются, либо запрещаются аксиоматически. В то же время для задач классификации сложных объектов, особенно в условиях неопределенности или неполноты данных, более целесообразным кажется построение группировки, совместимой со структурой исходных данных. Кроме того, структурное описание объекта может существенно сократить число признаков описания.

Данная работа посвящена проблеме разработки структурного описания объектов, определению способов сравнения и классификации структурных объектов.

2. Вычисление расстояния между объектами с использованием матриц связи

Пусть ,,..., - набор признаков объектов из генеральной совокупности . Предполагается, что измерение характеристик ведется в несколько этапов. Пусть на первом этапе измерены значения характеристик ,...,. Множество измеренных характеристик разбиваем на подмножества . Обозначим это разбиение = где множество представляет собой либо набор переменных , совокупность значений которых требует измерения других характеристик, либо является одноэлементным множеством, в том случае если значение характеристики содержащейся в нем не уточняется.

Пусть на следующем этапе описания измерены значения характеристик . Аналогично определяем разбиение , где либо одноэлементное множество, либо набор переменных, подлежащих уточнению. Далее продолжаем по той схеме: каждом этапе вычисляем значение некоторых переменных, а затем из этих переменных формируем множества, либо подлежащие дальнейшему уточнению, либо нет.

После проведения к этапов получаем конечное разбиение . Заметим, что множество характеристик, содержащееся в может быть подмножеством всего набора характеристик , не совпадая с ним полностью.

Для удобства дальнейших вычислений переобозначим переменные через .

Определение 1. Структурой на множестве назовем отношение такое, что классы , такие, что , и принадлежит множеству характеристик, уточняющих набор признаков из .

Определение 2. Структурным описанием объекта назовем пару .

На основе отношения определим матрицу связи между переменными .

Определение 3. - матрица размера с элементами, определенными следующим образом: ; называется матрицей связи признаков.

Матрица представляет собой матрицу направленных связей между объектами описания и однозначно представляет структуру множества признаков.

Замечание 1. Перестановкой строк и столбцов можно добиться чтобы матрица имела блочный вид (для этого строки соответствующие элементам, принадлежащим одному классу из разбиения, следует расположить рядом).

Пусть заданы структурные описания двух объектов из генеральной совокупности . Задав матрицы их структурного описания , , можем определить расстояние между структурными описаниями как число поразрядных несовпадений элементов матриц .

Определение 4. Расстояние между структурными описаниями определяется по формуле:

Заметим, что если объекты описываются не совпадающими полностью наборами переменных, то матрицы дополняются строками и столбцами, соответствующими недостающим элементам (добавляются нулевые строки и столбцы так, чтобы набор характеристик для матриц совпадал).

Представлен способ вычисления расстояний между структурными описаниями на основе сравнения матриц связи.

2.Определение расстояния в терминах распределений соответствующих группировок

Рассмотрим еще один метод вычисления расстояния между структурными описаниями, используя для определения расстояния информацию о численности классов из соответствующих разбиений.

Считаем, что заданы два структурных описания , где , , , , , .

Для связи обозначим количество элементов в классе ().

Через обозначим количество элементов в наборе характеристик, уточняющем набор переменных из класса , причем переменная принадлежит множеству уточняющих характеристик. Аналогично определяются величины , для связи .

Введем ряд обозначений.

Пусть, ,, , а через обозначим мощность множества .

Множество, уточняющее набор характеристик из класса и содержащее элемент обозначим , соответственно множество, уточняющее набор характеристик из класса и содержащее элемент обозначим как .

Определим величину как мощность множества совпадающих для указанных связей уточняющих наборов переменных: .

Определение 5. Расстояние между структурными описаниями будем вычислять по следующей формуле:

)=+-2

Теорема 1. Пусть заданы два структурных описания и соответственно заданы представляющие их матрицы . Тогда выполняется равенство ) =.

Расстояние между сложными объектами, вычисленное по приведенной выше формуле, как нетрудно заметить, зависит от численностей классов разбиения и. Но эти классы содержат не только набор характеристик, но и информацию о принадлежности совокупности значений этих характеристик некоторому подмножеству в признаковом пространстве. Что позволяет перейти к исследованию структуры объектов с точки зрения распределений соответствующих группировок.

 

Литература

  1. Куперштох В.Л., Трофимов В.А. Алгоритм анализа структуры матрицы.// Автоматика и телемеханика, 1975,№ 11, с.170-180.
  2. Лбов Г.С. Логические решающие функции.-Новосибирск,1998.
  3. Классификация и кластер. -М:Финансы и статистика, 1988.
  4. Жамбю М. Иерархический кластер-анализ и соответствия. –М.: Финансы и статистика, 1988.

Site of Information Technologies
Designed by  inftech@webservis.ru.